Nature 封面:AI 诊断皮肤癌胜过职业医师,“手机验癌”或可期?
该研究登上 Nature 572期封面。图片来源:Nature
2017年2月2日,Nature 报道了人工智能在医疗领域的又一突破性进展——利用基于深度学习的图片识别技术,AI 诊断皮肤癌的正确率及灵敏度均可达到甚至超过专业医师水平。
撰文 Susan Scutti
翻译 张竞文
审校 张士超
虽然“图像识别技术”这个词为我们勾勒了一幅先进监控技术的愿景,但是与间谍技术相比,这些设备在医学领域的应用或许会更早一步。据 Nature 2017年2月2日刊登的论文(Dermatologist-level classification of skin cancer with deep neural networks)称,斯坦福大学一研究团队对计算机进行了训练,使它能够像皮肤病学家一样准确地识别成为皮肤癌的痣和病变。
这项新的研究指出,在将来,一款简单的手机 app 就可以帮助患者自己诊断皮肤癌——美国当前最常见的癌症。“我们的目标是把顶尖皮肤病学家的专业知识带去那些没有专家的地方。” 这项新研究的投资人 Sebastian Thrun 说。他是谷歌研发实验室(Google X)的创始人,同时也是斯坦福大学的兼职教授。他还补充道,那些发展中国家的居民们目前并不能享受到与美国及其它发达国家相同水平的医护。
在全美国被确诊的皮肤癌病例中,黑素瘤仅占不足5%,但是皮肤癌的死亡病例中,有近四分之三都是它导致的。如果能够及时发现,黑素瘤的五年存活率可高达99%;而如果在晚期才被确诊,这个概率就会暴跌至14%。
通常,皮肤病学家只是通过观察来判断一个痣或其他病变是否类似癌症,然后通过后续的活组织检测确诊。
Yhrun 的研究团队开发了一套计算机深度学习系统,来完成确诊皮肤癌的第一项任务:一眼认出它来。
简而言之,这个团队创造出了一个自动化的皮肤病学家。
工作原理
Thrun 和他的同事们首先要使电脑具备图像识别的功能。他们所用的方法是一种基于算法的技术——深度学习。具体来说,研究团队利用了卷积神经网络技术。
Carl Vondrick 是麻省理工大学计算机科学与人工智能实验室的一位理学博士生,他并没有参与此项研究,但为我们解释了计算机的工作过程。
“卷积神经网络系统是一种计算机软件,非常擅于识别不同的概念。”他说。研究人员可以下载数字图像,“告诉”计算机这些图像是不是具有皮肤癌的特性。这台机器首先会尝试着学习一些规则去判断它是不是癌症。
“用’算法’来概括计算机的一系列计算过程是很恰当的。所以在这里,算法指他们调试这个系统的全过程。”Vondrick 说。
Andre Esteva 和 Brett Kuprel 是这篇新论文的共同一作,他们都是斯坦福大学电子工程专业的博士生。Andre 说,Thrun 和他的同事们基本是从“告诉算法这个世界看起来是什么样子”开始的。“我们首先从猫、狗、桌椅和日常生活中的每一件物品教起。我们用到了超过一百万个图像,数据量相当巨大。”Esteva 说。这个阶段的学习花费了大约一周时间。
接下来,Esteva 开始训练算法识别不同的皮肤状况。研究团队要解决一个复杂的问题:对于不同的病人,皮肤癌在皮肤上引起的症状表现是非常不一样的。
为了解决这个难题,研究员们给训练过的计算机(或者说人工智能)展示了海量的图片,共129,450张,涵盖超过2,000种皮肤病症状。这些图像来自18个医生在线助理存储库和斯坦福大学医药中心。
既然图片中的每一种痣和擦伤的都是经过诊断的,这些诊断方法同样会被计算机习得。
皮肤疾病分类图。图片来源:论文原文
人工智能与人类智慧的差别
“计算机视觉和那些卷积神经网络的强大之处在于,你只需要定义输入与输出的信息,然后计算机就会自己习得规则,并在下次自动做出判断。”Vondrick说。“可以说,它习得的是一系列数学上的转化:输入一个图像,输出‘这是不是皮肤癌?’的答案。”
Vondrick 补充道,计算机视觉系统与人类的视觉系统还有一个重要的差别。那就是,人类获取极少的信息量就能学会识别一个图案,计算机却需要学习成千上万,甚至几亿个范例。
“在上大学之前的20年里,你可能从没有见过皮肤癌。然后你进入医学院就读,只是看了一些相关的病例,就突然擅长识别这些疾病了。”他说。
良性皮肤病(上)与恶性皮肤病(下)的区别并不明显。图片来源:论文原文
研究人员们指出,计算机还不能达到这种学习速度,但是计算机视觉系统却可以通过数码图片检测人眼看不到的细节。
验证效果的时候到了:研究人员们给算法展示了之前未曾见过的图像。他们的人工智能系统能不能分别准确地识别出这些最常见、也是最危险的皮肤癌类型:恶性肿瘤和黑色瘤素呢?
“这个程序在对几个关键病例的诊断上已经和经过认证的皮肤病学家一样准确了。”Esteva 说。特别是,计算机可以“诊断包括黑素瘤在内的多种皮肤癌症状,而且我们可以只提供平常的临床图像,而不需要特殊的皮肤镜图像。”Roberto Novoa 说。他是这项研究论文的一位合著者,也是斯坦福医学院的一位皮肤病学家。
他解释道,医生通常用一种专门的工具——皮肤镜来检查皮肤是否患癌。虽然算法无法用到这种昂贵的仪器,该算法的准确度和灵敏度还是与21位皮肤病学家相当,甚至更优。
在考察准确度和灵敏度的三组对比实验中,人工智能(蓝线)击败了大部分职业医师(红点)。图片来源:论文原文。
Thrun,Esteva 和他们的同事们都警告说,在医疗场所使用临床设备进行正式检查依然是有必要的。但他们相信,这项研究成果也许会推广到其他的医疗领域,如眼科学、放射学与病理学等。
2021年,智能手机的认购量预计将达到63亿,该团队的新系统将以 app 为载体,在世界范围内提供价格低廉的诊断与医护途径。
现实中的麦科伊医生
科幻小说中充斥着电子视觉系统取代人类医生的情节。《星际迷航》系列的电视剧和电影中,伦纳德·麦科伊医生使用名为“三录仪”的便携人体诊断装置,为联合星舰企业号上的船员们进行健康情况检查。Sancy A. Leachman 博士(俄勒冈健康与科学大学皮肤学院院长,皮肤病学家)与 Glenn Merlino(国家癌症研究院高级研究员)在同期 Nature 发表关于此项新研究的评论,其中也提到了麦科伊医生。
《星际迷航》中的“三录仪”
两人写道,虽然依然是“异想天开”,机器带来的无创诊断总会“成为现实”。他们两人都没有参与此项研究。
即便如此,在自动化皮肤癌诊断系统推出之前,还至少有一项课题要做深入的研究。两人在评论中写道,不知新研制成的人工智能系统是否具有识别症状相似的不同癌症的功能。例如,系统要能够分辨出黑素瘤和良性的脂溢性角化病。后者是一种非癌症疣。
“即使是良性的增生也可能引起特定的并发症,只有专门经过临床诊断训练的医生才能够确诊。”Jill Waibel 博士说。她也是一名皮肤学者,而且是迈阿密皮肤病和激光研究所的所有人。
没有参与该研究的 Waibel 还补充道:“医学图像已经极大地改变了行医的方式。”特别是她的皮肤学领域。然而她表示,虽然已经有了许多激动人心的发现,这些新的成像系统都还在研究和调试中,以期得到最理想的应用。
对于许多科学家来说,《星际迷航》依然吸引着他们:未来世界会遍布机器,它们改正每一个错误,从中吸取经验,不断改善问题,取得进步。
“这是一项非常具体的研究,而且它得到了一个非常鼓舞人心的结果。”Thrun 说。同时,他也提醒道,在将这项研究发展为类似三录仪的设备之前,“我们在研究上还有很长的路要走。”
原文链接:http://us.cnn.com/2017/01/26/health/ai-system-detects-skin-cancer-study/index.html
论文信息
【论文题目】Dermatologist-level classification of skin cancer with deep neural networks
【作者】Andre Esteva, Brett Kuprel, Roberto A. Novoa, Justin Ko, Susan M. Swetter, Helen M. Blau & Sebastian Thrun
【期刊】Nature
【DOI】10.1038/nature21056
【摘要】Skin cancer, the most common human malignancy1, 2, 3, is primarily diagnosed visually, beginning with an initial clinical screening and followed potentially by dermoscopic analysis, a biopsy and histopathological examination. Automated classification of skin lesions using images is a challenging task owing to the fine-grained variability in the appearance of skin lesions. Deep convolutional neural networks (CNNs)4, 5 show potential for general and highly variable tasks across many fine-grained object categories6, 7, 8, 9, 10, 11. Here we demonstrate classification of skin lesions using a single CNN, trained end-to-end from images directly, using only pixels and disease labels as inputs. We train a CNN using a dataset of 129,450 clinical images—two orders of magnitude larger than previous datasets12—consisting of 2,032 different diseases. We test its performance against 21 board-certified dermatologists on biopsy-proven clinical images with two critical binary classification use cases: keratinocyte carcinomas versus benign seborrheic keratoses; and malignant melanomas versus benign nevi. The first case represents the identification of the most common cancers, the second represents the identification of the deadliest skin cancer. The CNN achieves performance on par with all tested experts across both tasks, demonstrating an artificial intelligence capable of classifying skin cancer with a level of competence comparable to dermatologists. Outfitted with deep neural networks, mobile devices can potentially extend the reach of dermatologists outside of the clinic. It is projected that 6.3 billion smartphone subscriptions will exist by the year 2021 (ref. 13) and can therefore potentially provide low-cost universal access to vital diagnostic care.
【链接】http://www.nature.com/nature/journal/v542/n7639/full/nature21056.html
阅读更多
▽ 故事
· 改进一项技术,改变数百万人的命运 | 专访首届未来科学大奖获奖人卢煜明
· 奔三了?你的大脑或许还未停止发育(附维持大脑健康的7种方法)
· Cell 报道全球首批人兽嵌合体——医学希望还是伦理之灾?
▽ 论文推荐
· 港中大生物物理学者在细菌中发现新的集体振荡规律 | Nature论文推荐
· 颜宁研究组报道首个真核生物电压门控钠离子通道近原子分辨率结构 | Science 论文推荐
· 睡眠时的大脑突触全面“缩水”或是学习能力的保证 | Science 论文推荐
▽ 论文导读
内容合作请联系
keyanquan@huanqiukexue.com
这里是“科学美国人”中文版《环球科学》服务科研人的微信号“科研圈”。我们:
· 关注科学进展与科研生态
· 推荐重要前沿研究
· 发布科研招聘
· 推送学术讲座与会议预告。
欢迎长按二维码关注。